Agentic Engineering（原 Vibe Engineering）

Simon Willison 在 2025-10-07 提出 Vibe Engineering，作为 Vibe Coding（凭感觉、不为结果负责）的对立面。2026-02-23 他更新文章承认社区已经统一用 Agentic Engineering 这个术语。本篇讲清楚这套范式：资深工程师如何用 AI 加速工作，同时为代码完全负责。

学前说明

这是一个关于身份和工作方式的章节，不是技术教程。

2025 年下半年，软件工程师群体出现了清晰的两极分化：

一端是 Vibe Coding——快速、随性、不负责。Andrej Karpathy 在 2025 年 2 月发明这个词，指的是"完全靠 prompt 驱动、不关心代码怎么工作"的开发方式。适合周末小项目、原型验证。但越来越多人把 Vibe Coding 当成主业，写出的代码自己也看不懂。

另一端就是 Agentic Engineering——经验丰富的工程师用 AI 工具大幅加速，但对产出的软件完全负责。这才是把 Coding Agent 真正用在生产环境的方式。

两者的分界线很简单：「我能不能自信地维护这段代码」。

为什么这一章重要

5-8 和 05 讲了"怎么用 Coding Agent"。但这一章回答更根本的问题：

用 AI 之后，工程师的核心技能变成了什么？
哪些传统好习惯在 AI 时代价值翻倍？
哪些新技能是 AI 时代独有的？
怎么判断一个团队/个人是 Vibe Coding 还是 Agentic Engineering？

学习目标

理解 Vibe Coding 和 Agentic Engineering 的本质区别
掌握 12 项 Agentic Engineering 核心实践
评估自己/团队在两个极端中的位置
建立向 Agentic Engineering 迁移的路径
重新校准对工时估算的判断

与现有知识的衔接

5-8 Coding Agent：工具使用（前置）
05 Parallel & Async Coding Agents：并行工作流（前置）
04 Lethal Trifecta：YOLO 模式的安全边界
02 Skills 体系：Skills 是 Agentic Engineering 的高级工具

第一章：Vibe Coding vs Agentic Engineering

1.1 定义

Vibe Coding（Karpathy, 2025-02）

一种用 AI 编程的新方式：完全凭直觉。我描述我想要什么，AI 写代码，我看一眼觉得对就接受。我不真正理解代码。

特点：

完全 prompt 驱动
不关心实现细节
不为代码维护负责
出问题靠继续 prompt 修
适合一次性、低风险任务

Agentic Engineering（Simon Willison, 2025-10）

经验丰富的专业工程师用 LLM 加速工作，同时自豪且自信地为他们产出的软件负责。

特点：

AI 大幅提速
工程师完全理解所有产出的代码
对长期维护负责
强烈的代码 review 文化
适合生产代码、长期项目

1.2 两者不是等级关系，是适用场景

很多人误以为 Agentic Engineering 是 Vibe Coding 的"高级版"。错。它们解决不同问题：

场景	合适方式	理由
周末玩具项目	Vibe Coding	出问题没关系，乐趣大于风险
一次性脚本（数据清洗）	Vibe Coding	用完即弃
客户原型 demo	Vibe Coding	验证想法，不上生产
公司核心业务代码	Agentic Engineering	必须长期维护
开源项目维护	Agentic Engineering	别人也要看懂
团队协作代码	Agentic Engineering	同事要 review
涉及金钱/隐私	Agentic Engineering	出错代价大

关键判断：问自己一句话——「这段代码 3 个月后我或我的同事还要维护吗？」是 → Agentic Engineering。否 → Vibe Coding 也行。

1.3 中间地带最危险

实际上，最大的问题不是"该用哪种"，而是很多人用 Vibe Coding 的方式做了应该用 Agentic Engineering 的事。

典型表现：

用 prompt 写了 production 代码，没读懂就 commit
bug 来了继续 prompt 让 AI 修，越改越复杂
半年后离职/接手的人完全看不懂
没有测试，但 AI 一直说"看起来能跑"
没有文档，靠"再 prompt 一遍 AI 就知道"

这是 2026 年最大的技术债来源。

第二章：Agentic Engineering 的 12 项核心实践

来自 Simon Willison 原文，每一条都解释了"为什么 AI 让这件事更重要"。

2.1 自动化测试（Automated Testing）

如果你的项目有一套完整、稳定的测试，agent 能飞起来。没有测试？Agent 可能声称代码"能工作"，但实际根本没测过。

为什么 AI 时代价值翻倍：

Coding Agent 在 loop 里跑测试 → 测试是 Agent 的"事实判定标准"
AI 写代码快 → 改动多 → 回归 bug 风险大 → 必须有自动测试兜底
Test-first development 跟 agent 配合特别好

实战：

# 给 Agent 的标准指令模板
> 实现功能 X。完成后必须满足：
> 1. pnpm test 全部通过
> 2. 新代码覆盖率 > 80%（pnpm test:coverage）
> 3. 不能修改测试文件来让测试通过

最后一条很关键——Agent 经常为了"测试通过"去改测试。明确禁止。

2.2 提前规划（Planning in Advance）

跟 agent 工作让规划更重要——你可以先在规划上迭代，再让 agent 写代码。

为什么 AI 时代价值翻倍：

没规划就 prompt：Agent 自己想方案，可能完全偏离你的架构
有规划：Agent 按你的方向走，review 时只看"是否符合规划"

参考 05 第六章的 Architect → Implementor 模式。

2.3 全面的文档（Comprehensive Documentation）

跟人类程序员一样，LLM 一次只能把 codebase 的一部分放进 context。好的文档让它能用你 codebase 其他部分的 API 而不用读源码。

为什么 AI 时代价值翻倍：

AI 不能一次读完 100 万行代码
文档是"高密度的 context 喂料"
写好 API 文档后，AI 能基于文档直接写实现

实战：在你的 CLAUDE.md、README.md、docs/ 里维护：

每个模块的职责（一段话）
关键 API 的签名和示例
项目约定（命名、错误处理、状态管理）
已知的坑和解决方案

2.4 好的版本控制习惯（Good Version Control Habits）

在 Agent 可能改了任何代码的世界里，能撤销错误、能查清楚谁什么时候改了什么——比以前更重要。LLM 在 Git 上非常厉害——它们可以追溯历史、找 bug 起源，用 git bisect 比大多数开发者还好。

为什么 AI 时代价值翻倍：

AI 改完不一定对，必须能快速回滚
频繁 commit 让"哪一步出问题"清晰可查
git bisect 用 AI 跑特别快

实战习惯：

# AI 干活前先 commit
git add . && git commit -m "wip: 准备让 agent 改 X"

# AI 干完
git diff  # 看改动
pnpm test  # 验证
git add . && git commit -m "feat: implement X (agent-assisted)"

# 不对？一键回滚
git reset --hard HEAD^

2.5 有效的自动化（Effective Automation）

持续集成、自动格式化、自动 lint、自动 deploy preview——这些都让 agent 受益。LLM 也让写自动化脚本更容易。

为什么 AI 时代价值翻倍：

Agent 跑了写好的脚本 = 你不用一步步指导
CI/CD 给 Agent 持续反馈
AI 帮你写新的自动化脚本（飞轮）

2.6 代码审查文化（Culture of Code Review）

这条不用解释。如果你审查代码又快又好，跟 LLM 工作就如鱼得水。如果你宁可自己写也不愿审别人写的，那跟 AI 一起工作会很痛苦。

为什么 AI 时代价值翻倍：

AI 写代码远快于人审查 → review 成了瓶颈
不擅长 review 的人无法用好 AI
review 技能 = AI 时代的核心竞争力

校验自己：

你能 10 分钟看完一份 200 行的 PR 并发现关键问题吗？
你看 diff 时能脑补"这改动会影响哪些地方"吗？
你能在 PR 评论里写出"建议 + 理由 + 替代方案"吗？

不行 → 你的 AI 利用率不会高。

2.7 奇怪的"管理"技能（A Very Weird Form of Management）

从 Coding Agent 拿到好结果，跟从人类协作者拿到好结果很像。你需要给清晰指令、确保有必要的 context、对产出给出可执行的反馈。

为什么 AI 时代价值翻倍：

给 AI 指令的能力 = 给初级工程师指令的能力
不善管理的人 = 不善"管理 AI"
反过来，管理经验在 AI 时代有意外用武之地

但有个 Simon 提到的有趣点：

管理 AI 比管理人简单，因为你不用担心冒犯或打击对方。

意思是你可以更直接：「这个实现不对，重写」「为什么没考虑 X 边界」——对 AI 说这些没心理负担。

2.8 强大的手工 QA（Really Good Manual QA）

除了自动化测试，你需要非常擅长手动测试软件，包括预测和深挖边界情况。

为什么 AI 时代价值翻倍：

AI 写的代码"看起来对"是常态，但边界 case 经常漏
自动化测试覆盖不到的，必须人来测
老练工程师的"直觉测试点"——AI 时代依然不可替代

实战：每个 AI 实现的功能，至少手动测：

空输入 / 极大输入 / 极小输入
网络断 / 后端慢 / 后端 500
并发场景（多人同时操作）
浏览器后退、刷新、关闭 tab
国际化（中文、emoji、阿拉伯语）

2.9 强大的研究能力（Strong Research Skills）

一个编程问题有几十种解法。找出最优方案、证明可行——这件事一直很重要，现在依然是 unleash agent 写代码前的瓶颈。

为什么 AI 时代价值翻倍：

AI 能写代码，但不能替你做技术选型
选错方案，AI 高速实现一堆错的
研究能力 = 决定 AI 给你 10x 还是 -3x

实战工具：

用 ChatGPT/Perplexity 做技术调研，但自己验证关键决策
派 Agent 做 PoC（参考 05 第二章模式 A）
读官方文档原文，不只看 AI 总结

2.10 部署到 Preview 环境（Ship to Preview Environment）

如果 Agent 构建了一个功能，安全地预览它（不直接 deploy 生产）让 review 更高效，也大幅降低上错代码的风险。

为什么 AI 时代价值翻倍：

AI 写得快 → 上 staging 频率高
没 preview → 要么本地试（慢）要么直上生产（险）
现代 Vercel/Netlify 自动 preview = 完美匹配

实战：每个 PR 自动起 preview，AI 改完你点开链接就能看效果。

2.11 判断"什么能外包给 AI"的直觉

这是持续演进的——模型和工具越来越强。跟 LLM 高效工作的很大一部分，是保持对"什么时候用 AI 最有效"的强烈直觉。

为什么 AI 时代价值翻倍：

半年前不能给 AI 的事，今天可能能
半年前 AI 做不好的事，今天可能做得好
不更新直觉 → 你的 AI 利用率落后于工具

实战：每月花 1-2 小时主动测试 AI 在新场景的能力。

2.12 更新工时估算（Updated Sense of Estimation）

AI 让估算更难。过去要花很久的事现在快得多——但估算现在依赖新因素，我们都在搞清楚。

为什么 AI 时代价值翻倍：

"这功能要 2 周" → AI 时代可能 2 天也可能 1 个月
老的估算公式全部失效
给老板汇报项目时这是高频痛点

Simon 提到这是高级工程师最难也最重要的技能之一。

第三章：核心洞察——AI 放大已有专业能力

Simon 在文章里反复强调一句话：

AI tools amplify existing expertise.

你的软件工程技能和经验越多，跟 LLM 和 coding agent 一起工作的产出就越快、越好。

3.1 这意味着什么

工程师等级	AI 加成	实际产出
初级（1-2 年）	1.2-1.5x	略快，但常犯错
中级（3-5 年）	2-3x	显著快，质量稳定
高级（5+ 年）	5-10x	飞跃式提升
专家（10+ 年）	10x+	重新定义"一个人能做什么"

为什么？因为：

高级工程师知道要做什么（AI 不会问）
高级工程师能 review 别人代码（AI 写的也能 review）
高级工程师有架构 sense（AI 不会自动避坑）
高级工程师懂工程实践（自动化测试、CI/CD）

3.2 反过来的推论

新手用 AI 不会变成专家。一些声音说"AI 让初级工程师快速变高级"——错。AI 让初级工程师产出看起来像中级，但他们的判断力和系统理解还是初级。

这就是中间地带的危险：看起来能交付，遇到复杂问题崩溃。

3.3 给个人和团队的启示

给个人：

不要因为 AI 强就放弃练基本功
学软件工程比学怎么用 AI 更重要
上面 12 条没掌握的，先补这些

给团队：

不要用 AI 取代培训新人，反而要加强培训
招人时考察review 能力 + 工程素养，不只是写代码
给团队建立 12 条对应的基础设施

第四章：评估自己的位置

4.1 自评矩阵

对以下 12 项打分（1-5）：

#	实践	自评（1-5）
1	自动化测试	__
2	提前规划	__
3	全面文档	__
4	版本控制	__
5	自动化	__
6	代码审查	__
7	管理（AI）能力	__
8	手工 QA	__
9	研究能力	__
10	Preview 部署	__
11	AI 适用场景直觉	__
12	工时估算	__

总分判断：

总分	你的位置	建议
12-24	Vibe Coder	用 AI 玩玩，别上生产
25-36	中间地带（危险）	立即补短板，否则代码会爆
37-48	早期 Agentic Engineer	继续打磨，找 1-2 项重点突破
49-60	成熟 Agentic Engineer	教别人吧

4.2 常见短板模式

模式 A：会写但不会审

高项：1, 3, 9
低项：6, 8
病根：习惯自己写，AI 写的看着烦
处方：练 review，先从小 PR 开始

模式 B：会审但不会规划

高项：6, 9
低项：2, 12
病根：习惯被动响应需求
处方：每个任务前强制写 5 分钟"规划"

模式 C：技术好但工程差

高项：1, 9
低项：3, 5, 10
病根：单兵作战出身，没经历过团队基础设施建设
处方：花 1-2 周专门补工程基础设施

4.3 团队评估

把 12 项对全员算平均分。再看：

哪一项团队平均低于 3？这是团队级短板，要建机制
哪几个人在某项显著低？这些人是培训重点

第五章：从 Vibe Coding 迁移到 Agentic Engineering

如果你或团队还在中间地带，下面是务实的迁移路径。

5.1 90 天迁移计划

第 1 月：建基础

给主力项目加上完整测试（覆盖率 > 60%）
建 CI（lint + test + build 必过）
写一份 CLAUDE.md / 项目规范

第 2 月：换工作流

强制要求"AI 写代码必须先 commit"
强制要求"AI 写完跑测试再 commit"
强制要求"AI 写的 PR 必须 review"
引入 preview 部署

第 3 月：升级技能

每周 1 次"AI 用法分享"，团队互学
引入并行 Agent 工作流（参考 05）
建立工时估算的新基线

5.2 不要做的事

❌ 一上来就追求"all in AI"——容易失控
❌ 因为短期慢就放弃测试——你在埋雷
❌ 把所有 review 都给 AI 做——人的判断不能省
❌ 引入太多并行 Agent——超过自己 review 能力就是负担
❌ 跳过 PR 直接 push main——你给自己埋的最大的雷

5.3 团队的文化建设

Agentic Engineering 不只是工具问题，更是文化问题：

文化	Vibe Team	Agentic Team
对 AI 代码的态度	"AI 写的我没看"	"AI 写的也是我的代码"
Bug 归属	"AI 写错了"	"我没 review 出来"
学习方式	"我让 AI 解释"	"AI 解释 + 我读官方文档"
招聘	"会用 AI 就行"	"工程基础 + 会用 AI"
代码 review	"能跑就 LGTM"	"理解每一行才 LGTM"

第六章：常见反问

问：Vibe Coding 完全不能用吗？

不是。一次性脚本、玩具项目、PoC、个人小工具——Vibe Coding 完全 OK。关键是你知道你在 Vibe Coding，而且场景合适。

问：我做的就是 Vibe Coding 风格的工具/创意类项目，需要变成 Agentic Engineering 吗？

如果只有你一个人维护、出错没关系、不长期演进——继续 Vibe Coding 没问题。如果你的"小工具"变成了用户依赖的产品、出错有代价、需要长期维护——必须升级。

问：Agentic Engineering 会被新 AI 替代吗？

短期不会。AI 越强，对"管 AI 的人"的判断力要求越高。Simon 原话：

你不只是写代码——你在研究方案、决定架构、写规范、定义验收标准、设计 agentic loop、规划 QA、管理一支越来越大的怪异数字实习生大军（他们如果有机会一定会作弊）、花大量时间在 code review 上。

这些是高级工程师的核心能力，AI 加强而不是替代。

问：怎么判断一个候选人/同事是 Vibe Coder 还是 Agentic Engineer？

最快的方法：让他口头解释他最近一周 AI 帮他写的某段代码。

Vibe Coder：解释不清，"反正能跑"
Agentic Engineer：能讲清楚每个决策、替代方案、为什么 AI 这么写

问：12 项里最优先补哪个？

如果只能选一个：自动化测试（#1）。

理由：

它是其他所有实践的基础
没有测试，你和 AI 都在黑盒操作
有测试，AI 才能真正进入 loop 模式

第二优先：代码审查（#6）。第三优先：版本控制（#4）。

第七章：未来方向

7.1 Agentic Engineering 工具化

2026 年开始出现专门的 "agentic engineering 平台"：

自动测试生成 + 维护
自动文档生成 + 同步
团队级 Agent 配置共享
工时估算辅助（基于历史 AI 任务数据）

7.2 角色分化

可能演化出新的工程角色：

Agent Wrangler：专门管理一群 Agent 的工程师
Spec Writer：写高质量 Agent 规范的人
AI Code Reviewer：专门 review AI 代码的（暂时人做，未来 AI 做）

7.3 教育和招聘

计算机教育会从"写代码"转向"工程实践"
招聘考察从"算法题"转向"review + 架构"
"用 AI 但说不清原理"会成为减分项

权威资料

Vibe engineering (Simon Willison, 2025-10-07)
Not all AI-assisted programming is vibe coding (Simon Willison, 2025-03-19)
Designing agentic loops (Simon Willison, 2025-09-30)
Embracing the parallel coding agent lifestyle (Simon Willison, 2025-10-05)
agentic-engineering tag
Your job is to deliver code you have proven to work (Simon Willison, 2025-12-18)
Karpathy on Vibe Coding (Twitter, 2025-02)
5-8 Coding Agent 与 AI 辅助开发（前置）
05 Parallel & Async Coding Agents（前置）
04 Lethal Trifecta 与 Agent 安全新范式

核对日期：2026-06-12

学前说明​

为什么这一章重要​

学习目标​

与现有知识的衔接​

第一章：Vibe Coding vs Agentic Engineering​

1.1 定义​

1.2 两者不是等级关系，是适用场景​

1.3 中间地带最危险​

第二章：Agentic Engineering 的 12 项核心实践​

2.1 自动化测试（Automated Testing）​

2.2 提前规划（Planning in Advance）​

2.3 全面的文档（Comprehensive Documentation）​

2.4 好的版本控制习惯（Good Version Control Habits）​

2.5 有效的自动化（Effective Automation）​

2.6 代码审查文化（Culture of Code Review）​

2.7 奇怪的"管理"技能（A Very Weird Form of Management）​

2.8 强大的手工 QA（Really Good Manual QA）​

2.9 强大的研究能力（Strong Research Skills）​

2.10 部署到 Preview 环境（Ship to Preview Environment）​

2.11 判断"什么能外包给 AI"的直觉​

2.12 更新工时估算（Updated Sense of Estimation）​

第三章：核心洞察——AI 放大已有专业能力​

3.1 这意味着什么​

3.2 反过来的推论​

3.3 给个人和团队的启示​

第四章：评估自己的位置​

4.1 自评矩阵​

4.2 常见短板模式​

4.3 团队评估​

第五章：从 Vibe Coding 迁移到 Agentic Engineering​

5.1 90 天迁移计划​

5.2 不要做的事​

5.3 团队的文化建设​

第六章：常见反问​

第七章：未来方向​

7.1 Agentic Engineering 工具化​

7.2 角色分化​

7.3 教育和招聘​

权威资料​

学前说明

为什么这一章重要

学习目标

与现有知识的衔接

第一章：Vibe Coding vs Agentic Engineering

1.1 定义

1.2 两者不是等级关系，是适用场景

1.3 中间地带最危险

第二章：Agentic Engineering 的 12 项核心实践

2.1 自动化测试（Automated Testing）

2.2 提前规划（Planning in Advance）

2.3 全面的文档（Comprehensive Documentation）

2.4 好的版本控制习惯（Good Version Control Habits）

2.5 有效的自动化（Effective Automation）

2.6 代码审查文化（Culture of Code Review）

2.7 奇怪的"管理"技能（A Very Weird Form of Management）

2.8 强大的手工 QA（Really Good Manual QA）

2.9 强大的研究能力（Strong Research Skills）

2.10 部署到 Preview 环境（Ship to Preview Environment）

2.11 判断"什么能外包给 AI"的直觉

2.12 更新工时估算（Updated Sense of Estimation）

第三章：核心洞察——AI 放大已有专业能力

3.1 这意味着什么

3.2 反过来的推论

3.3 给个人和团队的启示

第四章：评估自己的位置

4.1 自评矩阵

4.2 常见短板模式

4.3 团队评估

第五章：从 Vibe Coding 迁移到 Agentic Engineering

5.1 90 天迁移计划

5.2 不要做的事

5.3 团队的文化建设

第六章：常见反问

第七章：未来方向

7.1 Agentic Engineering 工具化

7.2 角色分化

7.3 教育和招聘

权威资料